热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

速比|出品_MNN开源项目荣获中国科协2021“年度优秀开源产品”

篇首语:本文由编程笔记#小编为大家整理,主要介绍了MNN开源项目荣获中国科协2021“年度优秀开源产品”相关的知识,希望对你有一定的参考价值。

篇首语:本文由编程笔记#小编为大家整理,主要介绍了MNN开源项目荣获中国科协2021“年度优秀开源产品”相关的知识,希望对你有一定的参考价值。



在中国科协召开的2022“科创中国”年度会议上,阿里巴巴两个开源社区荣获“年度优秀开源机构”,五大开源项目荣获“年度优秀开源产品”。


日前,中国科协正式发布2021“科创中国”开源创新榜单,推选出50项年度优秀开源产品及相关机构。其中,由阿里巴巴大淘宝技术团队开源的MNN深度学习推理引擎与其他四个阿里自研开源项目一起荣获“年度优秀开源产品”。



2022“科创中国”年度会议上,中国工程院院士周济发布“科创中国”系列榜单


MNN是由大淘宝技术出品的全平台轻量级高性能深度学习引擎。它从2018年开始,历经4届双十一考验,广泛支持了阿里巴巴在CV、ASR、NLP等领域的70+个AI应用场景,包含淘宝搜索推荐、拍立淘、淘宝直播、AR导购等核心场景,日调用量达十亿量级。MNN一直是推理引擎行业标杆,其架构论文发表于2020 SysML。MNN也普遍获得业界友商的认可,包含陌陌、美团、得物等至少数十家企业在使用。


在过去的一年,MNN一直在高性能、通用性方面沉淀扎实的推理引擎技术:


首先,在X86 CPU上,通过增加卷积调度参数、结合X86硬件特性汇编实现等优化手段,在常用模型如ResNet上,提速350+% (1Batch) 、70+% (16Batch)。在微观矩阵乘microkernel层面,其性能已达到计算峰值的98%以上!


其次,我们投资于ARM、X86平台稀疏计算,模型优化与引擎加速相结合,0.75稀疏度的CV模型在ARM平台加速比2.1 ~ 2.3 倍, x86平台加速比1.66 ~ 1.72倍。在淘宝实际业务的应用中,我们发现稀疏计算结合模型量化,可对模型进行极限压缩,满足端侧环境对于模型体积、内存占用、CPU占用的严格约束。


最后,基于MNN核心的张量计算库,我们低成本高效率地实现了OpenCV / Numpy功能,它有极简的包大小、原生OpenCV / Numpy库的使用体验、大幅的性能提升,进一步缩短了AI算法部署到端侧的「最后一公里」。


后续我们会陆续放出MNN在以上方向的技术干货,敬请大家期待!


在过去的一年,AI整体行业也经历了飞速的发展。算法上,主流任务模型日趋成熟,Transformer从NLP破圈进入CV,Vision Transformer 登顶 ImageNet;产业中,大量的AI、数据公司IPO,如Exscientia, Snowflake, UiPath, Confluent等,标志着AI开始迈向部署阶段。淘系端智能团队坚信,未来的AI部署将是端侧驱动、端云协同的。我们自主研发并对外开放了支持AI应用启蒙、无门槛训练和一键多端部署的一站式AI平台:MNN工作台,欢迎大家从MNN官网 (见文末二维码) 下载体验!



MNN官网



MNN开源交流群


✿  拓展阅读 




作者|淘系技术


编辑|橙子君


出品|阿里巴巴新零售淘系技术



推荐阅读
  • 生成式对抗网络模型综述摘要生成式对抗网络模型(GAN)是基于深度学习的一种强大的生成模型,可以应用于计算机视觉、自然语言处理、半监督学习等重要领域。生成式对抗网络 ... [详细]
  • 建立分类感知器二元模型对样本数据进行分类
    本文介绍了建立分类感知器二元模型对样本数据进行分类的方法。通过建立线性模型,使用最小二乘、Logistic回归等方法进行建模,考虑到可能性的大小等因素。通过极大似然估计求得分类器的参数,使用牛顿-拉菲森迭代方法求解方程组。同时介绍了梯度上升算法和牛顿迭代的收敛速度比较。最后给出了公式法和logistic regression的实现示例。 ... [详细]
  • 提升Python编程效率的十点建议
    本文介绍了提升Python编程效率的十点建议,包括不使用分号、选择合适的代码编辑器、遵循Python代码规范等。这些建议可以帮助开发者节省时间,提高编程效率。同时,还提供了相关参考链接供读者深入学习。 ... [详细]
  • 本文由编程笔记#小编为大家整理,主要介绍了logistic回归(线性和非线性)相关的知识,包括线性logistic回归的代码和数据集的分布情况。希望对你有一定的参考价值。 ... [详细]
  • CSS3选择器的使用方法详解,提高Web开发效率和精准度
    本文详细介绍了CSS3新增的选择器方法,包括属性选择器的使用。通过CSS3选择器,可以提高Web开发的效率和精准度,使得查找元素更加方便和快捷。同时,本文还对属性选择器的各种用法进行了详细解释,并给出了相应的代码示例。通过学习本文,读者可以更好地掌握CSS3选择器的使用方法,提升自己的Web开发能力。 ... [详细]
  • 推荐系统遇上深度学习(十七)详解推荐系统中的常用评测指标
    原创:石晓文小小挖掘机2018-06-18笔者是一个痴迷于挖掘数据中的价值的学习人,希望在平日的工作学习中,挖掘数据的价值, ... [详细]
  • 计算机存储系统的层次结构及其优势
    本文介绍了计算机存储系统的层次结构,包括高速缓存、主存储器和辅助存储器三个层次。通过分层存储数据可以提高程序的执行效率。计算机存储系统的层次结构将各种不同存储容量、存取速度和价格的存储器有机组合成整体,形成可寻址存储空间比主存储器空间大得多的存储整体。由于辅助存储器容量大、价格低,使得整体存储系统的平均价格降低。同时,高速缓存的存取速度可以和CPU的工作速度相匹配,进一步提高程序执行效率。 ... [详细]
  • 本文讨论了在openwrt-17.01版本中,mt7628设备上初始化启动时eth0的mac地址总是随机生成的问题。每次随机生成的eth0的mac地址都会写到/sys/class/net/eth0/address目录下,而openwrt-17.01原版的SDK会根据随机生成的eth0的mac地址再生成eth0.1、eth0.2等,生成后的mac地址会保存在/etc/config/network下。 ... [详细]
  • 本文介绍了操作系统的定义和功能,包括操作系统的本质、用户界面以及系统调用的分类。同时还介绍了进程和线程的区别,包括进程和线程的定义和作用。 ... [详细]
  • 本文介绍了在Python张量流中使用make_merged_spec()方法合并设备规格对象的方法和语法,以及参数和返回值的说明,并提供了一个示例代码。 ... [详细]
  • 背景应用安全领域,各类攻击长久以来都危害着互联网上的应用,在web应用安全风险中,各类注入、跨站等攻击仍然占据着较前的位置。WAF(Web应用防火墙)正是为防御和阻断这类攻击而存在 ... [详细]
  • 本文介绍了Python语言程序设计中文件和数据格式化的操作,包括使用np.savetext保存文本文件,对文本文件和二进制文件进行统一的操作步骤,以及使用Numpy模块进行数据可视化编程的指南。同时还提供了一些关于Python的测试题。 ... [详细]
  • 【论文】ICLR 2020 九篇满分论文!!!
    点击上方,选择星标或置顶,每天给你送干货!阅读大概需要11分钟跟随小博主,每天进步一丢丢来自:深度学习技术前沿 ... [详细]
  • Java在运行已编译完成的类时,是通过java虚拟机来装载和执行的,java虚拟机通过操作系统命令JAVA_HOMEbinjava–option来启 ... [详细]
  • 嵌入式处理器的架构与内核发展历程
    本文主要介绍了嵌入式处理器的架构与内核发展历程,包括不同架构的指令集的变化,以及内核的流水线和结构。通过对ARM架构的分析,可以更好地理解嵌入式处理器的架构与内核的关系。 ... [详细]
author-avatar
AU_123_126_218
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有